1
等式約束的最優性條件
MATH008Lesson 10
00:00
想像一個物理系統,例如懸掛的鏈條,尋求其最低能量狀態。若兩端點被固定,系統無法自由移動。當內部作用力(位能梯度)與約束所產生的張力完全平衡時,即達成最優狀態。在凸優化中,這種平衡由 KKT 條件 等式約束的條件所捕捉。

可行性的幾何結構

對於具有等式約束 $Ax=b$ 的凸問題,向量 $v \in \mathbf{R}^n$ 為 可行方向 若 $Av = 0$。這表示沿方向 $v$ 移動仍能維持約束:若 $Ax=b$,則 $A(x+v) = b$。

若 $x^*$ 為最優解,則對所有屬於零空間 $\mathcal{N}(A)$ 的可行方向 $v$,方向導數 $\nabla f(x^*)^T v$ 必須為零。這意味著梯度 $\nabla f(x^*)$ 必須與 $\mathcal{N}(A)$ 正交,進而導出 拉格朗日乘子的存在。

最優性條件

一點 $x^*$ 為最優解,當且僅當存在向量 $\nu^* \in \mathbb{R}^p$,使得:

$\nabla f(x^*) + A^T \nu^* = 0$

此方程組描繪了目標函數下降與約束流形之間的平衡狀態。

投影梯度

將負梯度 $-\nabla f(x)$ 歐幾里得投影 投影至零空間 $\mathcal{N}(A)$ 的公式如下:

$\Delta x_{\text{pg}} = \text{argmin}_{Au=0} \| -\nabla f(x) - u \|_2$

此向量代表「最佳」的可行下降方向。關鍵在於,$x$ 為最優解,當且僅當 $\Delta x_{\text{pg}} = 0$。

KKT 系統與矩陣性質

我們可透過分塊系統同時求解牛頓步長與對偶變數:

$$\begin{bmatrix} I & A^T \\ A & 0 \end{bmatrix} \begin{bmatrix} v \\ w \end{bmatrix} = \begin{bmatrix} -\nabla f(x) \\ 0 \end{bmatrix}$$

關於矩陣譜性質的註記: KKT 矩陣雖為對稱矩陣,但 不定。若該矩陣非奇異,則恰好擁有 $n$ 個正特徵值與 $p$ 個負特徵值。這表示最優點 $(x^*, \nu^*)$ 是拉格朗日函數 $L(x, \nu) = f(x) + \nu^T(Ax-b)$ 的 鞍點 ,而非在合併的原對偶空間中的簡單局部最小值。

🎯 核心原理
等式約束問題的最優性,要求梯度與約束的零空間正交。這使我們能將牛頓步長解釋為 KKT 條件的線性化近似之解。